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logiciel de navigation sur la toile est un logiciel utilise pour presenter un 
document a un utilisateur, et pour suivre les relations etablies entre ce 
document et d'autres documents au moyen de liens sur la toile (couramment 
appeles dans la litterature informatique liens Web). Un lien sur la toile est 
une reference permettant de designer un protocole d'acces, un systeme 
h&te, un chemin d'acces sur ce systeme, et eventuellement une ancre, 
permettant d'acceder a un document ou a une de ses parties. 

Aujourd'hui, dans la majorite des cas, les pages sur la toile sont 
realisees en utilisant des langages a balises. Le langage le plus 
communement utilise est le langage HTML (HyperText Markup Language - 
langage a balises hypertexte). D'autres langages commencent a s'imposer 
tel que le langage XML (extended Markup Language- langage a balises 
etendu ), mais ils sont pour I'essentiel tres proches du langage HTML. 

L'internationalisation d'un document consiste a permettre et faciliter la 
localisation dudit document dans une langue ou une culture donnee. La 
localisation d'un document est la procedure consistant a mettre en ceuvre 
des moyens pour transcrire ledit document dans une langue ou une culture 
donnee. L'intemationalisation concerne par exemple la traduction de 
messages textuels, sonores, et/ou video .... la transformation d'informations 
elementaires typees (dates, nombres, valeurs monetaires, ...), la 
representation de concept (representation d'une icone du type « panneau 
DANGER » du code de la route), le tri d'informations (ordonnancement 
d'informations), I'encodage (traduction numerique d'une information dans un 
format donne), la manipulation d'informations (la manipulation de jeux de 
caracteres : operations de concatenation, mise en majuscules ...) ... 

II convient de noter que tout ce qui concerne la presentation d'un 
document releve plus de sa personnalisation que de sa localisation. Par 
exemple, les choix de couleurs, des polices de caracteres ou des tailles de 


localisation. La localisation doit eviter la traduction du document et par 
exemple de toutes les pages sur la toile dans toutes les langues. 

Un autre probleme est la complexification du langage HTML et des 
langages de structuration et de mise en forme en general, la sophistication 
du contenu des pages sur la toile (le contenu des pages est de plus en plus 
riche, avec un nombre d'artifices de presentation croissant), ('utilisation 
d'editeurs (HTML, en particulier) evolues qui necessitent de plus en plus 
d'expertise de la part des traducteurs. 

Un but de la presente invention consiste a permettre la localisation de 
documents a balises sans intervention d'un utilisateur. 

Un but consiste a modifier les editeurs pour permettre 
rinternationalisation de pages de balises. 

Un autre but de la presente invention consiste a faciliter les 
traitements de localisation dans un systeme informatique, en particulier en 
evitant sa recompilation ou la livraison de ses sources. 

Resume de 1'invention 

Dans ce contexte, la presente invention propose un procede 
d'internationalisation du contenu de documents a balises consistant a : 

• detecter une balise destinee a la localisation du document, un ou des 
attributs de localisation, et eventuellement une valeur de localisation par 
defaut associee a ladite balise au moyen d'un outil de localisation ; 

• rechercher, si necessaire, dans des moyens de memorisation dans un 
fichier de traduction la valeur localisee de I'element associe a cet ou ces 
attributs de localisation ; 


Presentation des figures 


D'autres caracteristiques et avantages de 1'invention apparaitront d la 
lumiere de la description qui suit, donnee a titre d'exemple illustratif et non 
limitatif de la pr§sente invention, en reference aux dessins annexes dans 
lesquels : 

• la figure 1 est une vue schematique d'une forme de realisation du 
systeme d'internationalisation selon I'invention ; 

• la figure 2 est une vue schematique d'une forme de realisation d'un 
editeur permettant I'internationalisation selon I'invention. 

Description d'une forme de realisation de I'invention 

Comme le montre la figure 1 illustrant une forme de realisation du 
systeme d'internationalisation selon I'invention, un systeme informatique 1 
est distribue et compose de machines 2-4 organisees en un ou plusieurs 
reseaux 5. Une machine est une unite conceptuelle tres large, de nature 
materielle et logicielle. Les machines peuvent etre tres diverses, telles que 
des stations de travail, serveurs, routeurs, machines specialisees. Une 
machine comprend au moins un processeur, au moins une m§moire t 
eventuellement un ou plusieurs peripheriques... Seuls les composants des 
machines du systeme 1 caracteristiques de la presente invention seront 
decrits, les autres composants etant connus de I'homme du metier 

II est a noter que les machines 2-4 sont susceptibles d'etre 
regroupees les unes aux autres de diverses fagons et peuvent par exemple 
ne constituer qu'une seule et meme machine. 

La figure 1 represente un exemple de forme de realisation du systeme 
d'internationalisation selon I'invention. 
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La machine 4 de localisation contient un outil 1 1 de localisation se 
presentant sous la forme d'un module logiciel. L'outil de localisation peut 
faire appel a des moyens 12 de memorisation de la correspondence entre le 
type du document 8 et le langage a balises utilise, des balises dudit langage 
a balises et de sa grammaire et syntaxe, ainsi que des fonctions de 
transcription automatiques. Les moyens 12 de memorisation sont contenus 
dans la machine 4 de localisation ou lies a celle-ci. lis se presentent dans la 
forme de realisation illustree sur la figure 2 sous la forme d'un disque dur. La 
machine 4 de localisation permet de creer des fichiers 13 localises a partir 
du fichier 8 de reference et du fichier 10 de traduction. 

Comme le montre la figure 2, la presente invention concerne 
egalement un editeur 14 de pages sur la toile, par exemple un editeur de 
pages HTML. L'editeur 14 est un module logiciel contenu dans une machine 
15 d'edition et offrant a tout utilisateur des facilites pour ecrire une page sur 
la toile. L'§diteur 14 est connecte a des moyens 16 de stockage tels que par 
exemple un disque dur. L'editeur est connecte a une machine 2 de reference 
elle-meme connecte & un reseau 6 de machines tel que par exemple le 
reseau Internet. La machine 2 de reference est comme dans la forme de la 
realisation illustree sur la figure 1 un serveur 2 d'acces au reseau 6. 

Le systeme 1 selon la presente invention fonctionne de la maniere 
suivante. 

Le systeme 1 localise le contenu de documents 8 ; dans le systeme 
d'internationalisation illustre sur la figure 1, les documents 8 sont les fichiers 
8 de reference contenant les elements a localiser. 

Le procede d'internationalisation selon Tinvention comprend une 
etape d'identification du type de document 8 a localiser au moyen de l'outil 
11 de localisation. Le type du document, et dans I'exemple illustre du fichier 
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minimum un type qui peut etre un type par defaut et done absent de la 
balise. lis peuvent egalement comprendre par exemple un identifiant, des 
parametres, et des attributs specifiques du type, comme il sera vu plus loin. 
A titre illustratif, le message « Mon petit commerce » a localiser dans 
diverses langues est identifie par I'identifiant unique « 1 » ; il est type par le 
type TEXT (I'element a localiser est un texte). 

Le procede selon invention est base sur la definition de balises 
destinees a reperer les elements identifies a localiser a I'aide des attributs 
de localisation. 

Le procede consiste au moyen de I'outil 11 de localisation contenu 
dans la machine 4 de localisation a detecter dans le fichier 8 de reference 
une balise destinee a la localisation, a recuperer le ou les attributs de 
localisation associees aux dites balises, a rechercher dans les moyens 9 de 
memorisation le fichier 10 de traduction correspondant a la langue ou a la 
culture ciblee, a rechercher dans le fichier 10 selectionne lesdits attributs de 
localisation et les valeurs de localisation associees aux attributs de 
localisation uniques obtenus dans le fichier 8 de reference, et a remplacer 
les balises du fichier 8 de reference par les valeurs de localisation 
correspondantes apportees par le fichier 10 de traduction. 

Dans la forme de realisation illustree sur la figure 1, le procede 
consiste a localiser une page 8 sur la toile contenue dans le serveur 2 de 
pages sur la toile. 

Les balises dediees a la localisation reprennent la syntaxe et la 
grammaire des balises du langage HTML/XML. 

Un resume des caracteristiques du langage HTML dans ce qui suit 
facilite la comprehension de la forme de realisation illustree. 
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Dans le langage HTML, il existe des balises pour declarer des liens 
vers d'autres pages sur Internet, des inclusions d'images, de video, etc. 

Le langage HTML est I'objet de plusieurs documents de 
standardisation (IETF et W3C essentiellement). Les fournisseurs 
d'implementation de navigateur sur la toile prennent en compte ces 
specifications mais leur ajoutent des specificites pour offrir plus de services 
et plus de possibilites de personnalisation de documents Internet aux 
utilisateurs. II en resulte une incompatibility de representation d'un 
navigateur a I'autre. Le principe suivant a done ete adopte : lorsqu'une 
balise dans un document HTML n'est pas reconnue par le navigateur, elle 
est tout simplement ignoree et rien n'est affiche. 

L'exemple illustre repose sur des pages ecrites en HTML pour 
essentiellement deux raisons : 

- la presence de balises permettant d'isoler ('information 
d'internationalisation du reste des informations, de representation 
et de contenu en particulier, 

- le comportement des navigateurs devant des balises inconnues 
offrant des facilites de mise au point et de livraison, le fichier de 
reference pouvant etre utilise comme foumiture standard pour la 
langue pivot de I'application (la langue pivot etant celle avec 
laquelle Tapplication travaille par defaut). 

La presente invention peut s'appliquer a d'autres documents que les 
pages sur la toile ecrites en HTML, si lesdits documents sont formalises 
avec un langage a balises et que la syntaxe en est connue. 
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<LOC TYPE=CUR>Nombre defini dans un format neutre (ex : [+|- 

|]AAA[.BBB]) parametrable </LOC> 

• pour les champs de type image (icones, ...) : 

<LOC ID=identifiant-de-message TYPE=NUM> Chemin (optionnel) 

par defaut, correspondant a la langue pivot </LOC>. 

Dans le present exemple, les balises ne sont pas dediees a un 
langage particulier. En revanche, leur syntaxe reprend celle des langages 
HTML et XML, ce qui permet de couvrir un large portefeuille de documents. 
Le procede est applicable au langage parent de ces deux langages, soit le 
langage SGML. Le choix du nom de la balise doit etre configurable : 
I'essentiel est qu'il n'y ait pas de collision avec des balises deja definies 
dans le langage dans lequel doivent s'inserer les balises de localisation. 

^utilisation du mot cle LOC comme identifiant de balise est proposee 
a titre d'exemple. Ce mot cle pourrait etre remplace par un autre mot cle 
(LOCAL, LOCALIZATION, ...) dans d'autres langages a balises utilisant deja 
ce mot cle. Le choix de ce mot cle doit etre fait de telle maniere qu'il soit 
unique et sans ambiguTte dans le langage a balises utilise, et qu'il soit connu 
des differents outils manipulant les pages a balises (les editeurs de pages et 
I'outil 11, en particulier). 

La presence d'un identifiant unique de contenu a localiser associe a 
chaque balise de localisation peut etre rendue optionnelle pour certains 
types de donnees. Pour les donnees de type numerique, par exemple, il est 
possible d'utiliser des fonctions de transcription automatique, comme par 
exemple des fonctions de localisation standards (fournies sous formes de 
programmes, stockes dans les moyens de stockage 12 de I'outil 11) qui 
permettent d'automatiser la remise en forme de reformation dans une 
langue ou une culture donnee a partir d'un format de donnee pivot. A titre 
d'exemple, dans le cas particulier des cultures anglo-saxonnes, ces 


Le contenu de la page a I'annexe 3 est plus simple mais necessite le 
fichier de traduction tel que le fichier de traduction en frangais de I'annexe 4 
donnant la valeur a associer a chacun des identifiants cites dans le 
document. Dans Pexemple de I'annexe 3, la page n'est pas directement 
affichable dans la langue pivot : elle doit passer dans I'outil de localisation 
permettant sa traduction. 

II est possible de definir des types particuliers pour des sources 
d'informations non prevues par le langage HTML et susceptibles d'§tre 
localisees. Par exemple, dans certains pays ou dans certains 
environnements de travail, un son de tacot se produit lorsqu'une erreur 
intervient. Le type de son emis lorsque survient un evenement particulier 
differe suivant les pays et les habitudes de chacun. II est done possible de 
proposer un type supplemental « SOUND » permettant de traiter ce type 
de situation. Un autre exemple concerne les conventions de couleur 
utilisees par certaines cultures pour exprimer certains concepts ou certains 
evenements : I'abondance ou la richesse peut etre representee par le jaune 
ou le rouge, le deuil peut etre represents par le noir, le blanc ou le rouge. II 
est possible de proposer une balise « COLOR » comportant un attribut 
« CONCEPT » et un attribut « VALUE » pour representer ce type de 
situation. 

L'outil 11 de localisation detecte les balises de localisation et les 
attributs de localisation associes auxdites balises, recherche dans les 
moyens 9 de memorisation le fichier 10 de traduction correspondant a la 
langue ou a la culture ciblee, puis recherche dans le fichier 10 selectionne 
lesdits attributs de localisation et les valeurs de localisation associees 
auxdits attributs de localisation uniques obtenus dans le fichier 8 de 
reference. 

Le procede consiste aussi a definir ledit fichier 10 de traduction. Le 
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• <LOC NUM=2>100K/LOC> 

• <LOC NUM=3> : le fichier </LOC> 

<LOC NUM=4>C:\COMMAND.COM</LOC> 

• <LOC NUM=5> n'existe pas.</LOC>. 

En effet, certaines langues ne traduisent pas ce message de la meme 
maniere : elles peuvent ne pas prendre en compte ou supprimer un de ces 
cinq messages ou encore changer Tordre des parametres ou messages. En 
anglais par exemple, le message peut se transformer de la fa?on suivante : 

<LOC NUM=1 >Error N°</LOC> 
<LOC NUM=2>1 001 </LOC> 

• <LOC NUM=3>C:\COMMAND.COM</LOC> 

• <LOC NUM=4> file does not exist.</LOC> 

Le procede selon I'invention consiste done a numeroter les 
parametres des messages PARAM1 , PARAM2, ... et a introduce des 
etiquettes par exemple du type '%numero' dans lesdits messages. 
L'invention traite le cas precedent de la maniere suivante : 

<LOC NUM=1 PARAM1 = M 1 001 " PARAM2= M C:\COMMAND.COM M > 
Erreur N°%1 : le fichier %2 n'existe pas. </LOC> 

Dans I'exemple des annexes 2 et 3, le site Quincaillerie.com est un 
parametre puisqu'il est invariable quelque soit la langue, le pays ou la 
culture. La balise numerate ce premier parametre : PARAM1 et I'identifie par 
I'etiquette %1. Cette information est stockee dans le fichier de reference. 
Elle sera utilisee par I'outil de localisation charge de relire le fichier de 
reference et les fichiers contenant les messages localises pour constituer le 
document final localise. 
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localises est faite « en usine » avant la mise sur cederom de tous les fichiers 
de I'application, auquel cas tous les fichiers localises sont mis a disposition 
du producteur avant le pressage du cederom et les fichiers localises sont 
Iivr6s (avec ou sans les fichiers de reference) directement sur le ced6rom. 
Cette forme de realisation evite d'avoir a livrer, documenter, maintenir vis-£- 
vis de tiers I'outil 1 1 de localisation. 

L'outil 11 de localisation est eventuellement livre (avec les fichiers 8 
de reference) aux tiers pour qu'ils etendent par eux-memes le nombre de 
langues supportees. Cela implique une documentation des fichiers 8 de 
reference pour faciliter la constitution des fichiers 10 de traduction, et la 
mise en place d'une structure capable de repondre aux questions de ces 
tiers. 

Une autre forme de realisation consiste a livrer I'outil 11 de 
localisation et les fichiers 8 de reference, les fichiers localises etant realises 
a Installation du logiciel (ce qui offre un gain de place sur le cederom dudit 
logiciel), a la demande (quelques temps apres Installation), ou « a la 
volee » (i.e. : en cours d'execution, comme explique precedemment avec les 
solutions JavaScript embarquees dans des pages sur la toile, ou Tutilisation 
de processus CGI). 

Une autre forme de realisation de I'invention conceme les lecteurs de 
cederoms MP3 sur lesquels sont inscrits des fichiers XML. Les fichiers XML 
contiennent des informations sur les titres stockes sur le cederom, les 
paroles associees a chacun des titres et I'encodage MP3 des titres en 
question. Les fichiers XML constituent des fichiers 8 de reference. Lorsque 
le lecteur de cederoms lit les fichiers XML , il est en liaison avec un outil de 
localisation et des fichiers de traduction qui permettent la constitution de 
fichiers XML localises suivant le pays dans lequel on se trouve. 
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localisation (a quelques exceptions pres. concernant notamment les 
messages avec des parametres). 

Un autre avantage est I'existence de d'analyseurs syntaxiques de 
langages a balises ; ils sont nombreux, peu encombrants et tres faciles a 
utiliser. La conception de I'outil de localisation pourrait reposer selon une 
forme de realisation sur des analyseurs syntaxiques existants. 

La presente invention concerne le procede d'internationalisation du 
contenu de documents 8 a balises consistant a : 

• detecter une balise destinee a la localisation du document 8, le ou les 
attributs de localisation, et eventuellement la valeur de localisation par 
defaut associee a ladite balise au moyen de I'outil 1 1 de localisation ; 

• rechercher, si necessaire, dans les moyens 9 de memorisation dans le 
fichier 10 de traduction la valeur localisee de I'element associe a cet ou 
ces attributs de localisation ; 

• remplacer dans le document 8 la balise par la valeur localisee retrouvee 
dans le fichier 10 de traduction, ou par la valeur de localisation par 
defaut, ou par une valeur obtenue a travers les fonctions de transcription 
automatique. 

Le procede consiste a rechercher le type du document 8 de maniere a 
reconnaitre les balises utilisees dans ledit document et leur grammaire et 
syntaxe et realiser la detection des balises destinees a la localisation. 

Le procede consiste a utiliser comme attribut de localisation un identifiant 
unique, un type d'element, et eventuellement des parametres et/ou des 
attributs specifiques du type. 

La balise destinee a la localisation reprend le formalisme d'un langage a 
balises. 
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L'outil 1 1 de localisation est un composant CGI. 

La presente invention concerne le procede d'edition et 
d'internationalisation de documents 8 a balises consistant, a chaque fois 
qu'un utilisateur saisit lors de I'edition du document 8, un contenu a 
internationaliser, & associer audit contenu le ou les attributs de localisation, 
a proposer la saisie d'une valeur par defaut du contenu a internationaliser, 
et a proposer la saisie de tout ou partie des differentes valeurs prises par ce 
contenu dans les differentes langues cibles du document en cours d'edition, 
a creer le document 8 et les fichiers 10 de traduction associes a partir des 
informations obtenues de I'utilisateur, et a memoriser lesdits fichiers dans 
les moyens 16 de stockage. 

La presente invention se rapporte au systeme d'edition et 
d'internationalisation comprenant I'editeur 14 dans la machine 15 d'edition 
des documents 8 a balises permettant la creation des fichiers 8 de 
reference et des fichiers 10 de traduction associes a partir d'informations 
obtenues de I'utilisateur et leur memorisation dans les moyens 16 de 
stockage. 

La presente invention concerne le procede d'internationalisation du 
contenu de documents 8 a balises consistant a : 

• Definir des balises destinees a la localisation ; 

• Identifier les informations a localiser dans le document 8 au moyen 
d'un ou de plusieurs attributs de localisation ; 

Associer les balises de localisation aux attributs de localisation dans 
le document 8 de maniere a permettre sa localisation. 


</UL> 


</BODY> 
</HTML> 
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<UL> 

<LI><AHREF="http://www.bullsoft.com">BullSoft</A></LI> 
</UL> 


</BODY> 
</HTML> 
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<LI><A HREF="http://www.bullsoft.com">BullSoft</A></LI> 
</UL> 


</BODY> 
</HTML> 
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REVENDICATIONS 

1. Procede d'internationalisation du contenu de documents (8) a balises 
consistant a : 

• detecter une balise destinee a la localisation du document (8) t un ou des 
attributs de localisation, et eventuellement une valeur de localisation par 
defaut associee a ladite balise au moyen d'un outil (1 1) de localisation ; 

• reC h erC her, si necessaire, dans des moyens (9) de memorisation dans un 
fichier (10) de traduction la valeur localisee de I'element associe a cet ou 
ces attributs de localisation ; 

• remplacer dans le document (8) la balise par la valeur localis6e 
retrouvee dans le fichier (10) de traduction, ou par la valeur de 
localisation par defaut, ou par une valeur obtenue a travers des fonctions 
de transcription automatique. 

2. Procede selon la revendication 1, caracterise en ce qu'il consiste a 
rechercher le type du document (8) de maniere a reconnaitre les balises 
utilisees dans ledit document et leur grammaire et syntaxe et realiser la 
detection des balises destinees a la localisation. 

3. Procede selon Tune des revendications 1 ou 2, caracterise en ce qu'il 
consiste a utiliser comme attribut de localisation un identifiant unique, un 
type d'element, et eventuellement des parametres et/ou des attributs 
specifiques du type. 

4. Procede selon Tune des revendications 1 a 3, caracterise en ce que la 
balise destinee a la localisation reprend le formalisme d'un langage a 
balises. 
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10. Systeme selon la revendication 9, caracterise en ce que I'outil (11) de 
localisation est implements dans un langage de generation dynamique de 
code et le code de I'outil (11) est charge dans le document (8) gen6rant son 
propre code de maniere dynamique. 

11. Systeme selon la revendication 9, caracterise en ce que I'outil (11) de 
localisation est un composant CGI. 

12. Procede d'edition et d'internationalisation de documents (8) a balises 
consistant, a chaque fois qu'un utilisateur saisit lors de I'edition du document 
(8), un contenu a internationaliser, a associer audit contenu un ou des 
attributs de localisation, a proposer la saisie d'une valeur par defaut du 
contenu a internationaliser, et a proposer la saisie de tout ou partie des 
differentes valeurs prises par ce contenu dans les differentes langues cibles 
du document en cours d'edition, a creer le document (8) et des fichiers (10) 
de traduction associes a partir des informations obtenues de I'utilisateur, et 
a memoriser lesdits fichiers dans des moyens (16) de stockage. 

13. Systeme d'edition et d'internationalisation comprenant un editeur (14) 
dans une machine (15) d'edition de documents (8) a balises permettant la 
creation de fichiers (8) de reference et des fichiers (10) de traduction 
associes a partir d'informations obtenues de I'utilisateur et leur memorisation 
dans des moyens (16) de stockage. 


